Pour une 2e année consécutive, vous avez été invité à compléter un sondage sur votre utilisation des outils technologiques1. Pourquoi une rétrospective? Premièrement pour se doter d’un état de la situation basée sur des données et deuxièmement pour nous permettre d’adresser certaines problématiques en lien avec l’utilisation des outils technologiques. Votre participation est autant bénéfique pour vous que pour ceux qui administrent les outils. Les priorités en découlent directement. 41 personnes ont répondu. Voici les résultats.
Pour cette question, nous voulions évaluer l’utilisation d’un gestionnaire de code source et de quatres outils de manipulation de données. L’outil le plus utilisé est Excel à 90.2% et le moins utilisé est Anaconda Enterprise à 7.3%.
Pour cette question, nous vous demandions votre satisfaction par rapport à l’utilisation de ces mêmes outils. L’outil le plus apprécié est Github/Bitbucket à 4.50/5 et le moins apprécié est Anaconda Enterprise à 1.50/5.
Pour cette question nous vous demandions de classer neuf outils selon leur importance pour effectuer votre travail. L’outil le plus utile est RStudio avec 41% des votes de 1er rang.
Pour cette question nous vous demandions de classer six langages selon leur importance pour effectuer votre travail. Le langage le plus utile est R avec 59% des votes de 1er rang.
La satisfaction face aux améliorations apportées aux outils suite aux commentaires de l’an passé.
Confiance en leurs capacités d’utiliser les outils technologiques
Vous aviez également la possibilité de partager vos commentaires sur votre expérience avec les outils. Certains de vos commentaires peuvent mener à des actions concrètes.
Pour la data science il manque un IDE pour python ayant une interface quasi semblable à Rstudio. A savoir, le script, la console, les graphs et les variables
Pour ceux qui sont en python ca serait cool d’avoir un envirronement de travail standardisé dans lequel on peut installé ce que l’on veut. - L’accès aux données est très départager entre les personnes d’une meme équipe - Il manque des outils de science de la données (Outils de traitement de données, de suivi d’expériences, etc..) - Pour ceux développent en python, il est difficile d’utiliser le package d’extraction de données en production (étant donnée qu’il est développé en R)
Vous êtes supposé avoir Anaconda Enterprise pour ça. Sinon, ——- s’en vient cette année avec qui vous donnera accès à VS Code et Jupyter Lab pour le développement Python. Pour ce qui est du développement de packages d’extraction en Python, à la base ces outils ont été créé pour les besoins de la ——-.
Parfois la ——- plante quand le data utilisé est trop gros
La RAM sur ——-. Je pense qu’on manque de formation.
La gestion de la RAM est difficile ——- et ça devient problématique lorsque plusieurs utilisateurs concurrents doivent exécuter des requêtes demandant beaucoup de ressources
la ——- marche pas et je comprends pas pq. c tj une niaiserie ou p/r a un espace de trop ou je sais pas
La ——- est utilisée par beaucoup plus d’utilisateurs qu’anticipé, en partie à cause ——-, et en partie à cause de la croissance des équipes. Lors de la mise ——-, nous ——- pour répondre à la demande. Il y a une conscientisation à faire auprès des utilisateurs pour qu’ils réduisent la consommation des ressources communes.
La version du ——- ne me permet pas d’identifier l’utilisateur connecté. Mon application utilisée par ——- n’est pas en mesure de retracer qui a fait quoi.
C’est une des raisons pour laquelle nous faisons l’acquisition de ——-.
J’ai hâte à ——- pour pouvoir rouler des rapports de façon récurrente et programmer le tout facilement. C’est dommage que les ——- ne soient pas disponibles sur ——-.
Moi aussi. Il y a des délais suite à ——-. Pour ——-, le point revient souvent. Les ——-. La première demande a été faite ——-. On ne peut ——-. On va peut-être avoir plus de chance avec ——-.
Aucun irritant quotidien, ni problématique récurrentes. Pour l’instant, les outils à ma disposition me permettent de faire mon travail.
Mon plus grand irritant: ne pas me faire confiance / avoir peur de faire chier quelque chose. Sinon, je me rends compte qu’il y a énormément de doc, mais que je ne la connais pas toute. Je pars toujours de la page ——-, mais j’ai tendance à me perdre un peu dedans (surtout dans ——- puisque les noms de base ne m’inspirent pas toujours). I guess qu’avec le temps je vais mieux me diriger. J’ai aussi eu quelques difficultés à tout relié (git hub, vm , …). Mais on m’a vraiment aidé là-dedans et au final tout fonctionne. ** Commentaires: Sérieux solide job. Vous êtes toujours prêts à aider les moins expérimentés (aka moi) et vous êtes très patients. J’avais pas mal peur d’embarquer sur les vm et sur git et blablabla, mais finalement, ça bin de l’allure cette petite bête là.
La ——- est un outil incroyable. L’accès à la donnée est simplifié, notre ordinateur n’est pas ralenti par nos calculs, etc. Il faut, selon moi, favoriser cette approche et chercher à limiter les manques de mémoire :)
PAr rapport à ces outils nommés, pas d’irritants car j’utilise que Excel et Microsoft SQC serveur Management studio
Super, content pour vous.
Les versions de package dans R. Je trouve que je manque d’autonomie dans le déploiement d’applications sur un serveur.
Pour les déploiements d’applications en production, nous maintenons cette responsabilité au sein d’une plus petite équipe, mais nous sommes ouverts à partager nos connaissances. Nous utilisons les mêmes procédés que le reste de l’entreprise. Si le travail de data engineering vous intéresse, surveillez les disponibilités dans l’équipe ——-. Pour des applications plus simple, sans objectif de production, nous aurons bientôt ——-.
La mise à jour des outils dans la ——- à un décalage.
Je suis d’accord, les ——- le reste est en dehors de notre sphère d’influence.
Pas personnellement, mais je crois que dans un futur plus ou moins rapproché, il faudrait automatiser un genre de ——- avec des tables de roulées automatiquement que les gens utilisent souvent ——-. Ça faciliterait la vie et la confiance des nouveaux users s’ils n’ont pas à ——- tout le temps.
C’est une idée qui revient ponctuellement. Ce qui semble fréquent pour un groupe est totalement différent d’un autre groupe. Pourquoi ne pas mettre en place ce processus pour votre équipe?
Plusieurs erreurs dont on n’est pas en mesure nous-même de régler surviennent assez fréquemment pour être irritantes (nouveau token, rprofile pas bon, renviron pas bon, cache qui se vide sur les vm, …) même si on a de la bonne documentation qui règle certains problème, on doit souvent se rabattre à demander certaines personnes pour régler nos problèmes. Ce sont des irritants importants pour les personnes qui tentent de se convertir à ces nouveaux outils. Je crois qu’il faudrait réduire autant que possible la fréquence de ces irritants.
Nous déployons beaucoup d’efforts pour que l’utilisateur final rencontre le moins d’erreurs possibles. L’évolution constante des outils comme Github et la ——- demeure une source importante d’irritants. Dites-vous, que ce que vous rencontrez dans votre quotidien n’est que la pointe de l’iceberg. Ce n’est pas une excuse, mais sachez nous tentons de nous adapter le plus rapidement aux changements externes.
La documentation R est très intéressante, mais reste à un niveau que je considère avancé (plus pour modélisation/tarification). Il pourrait y avoir peut-être plus d’exemple dans la doc R pour des besoin de base : comme extraire des listes de données selon certain filtre, faire des stats etc (question de moins déranger ——-)
Nous avons ce point sur la feuille de route depuis le début. Le mieux pour l’instant c’est de s’inspirer du code déjà existant. Lorsque vous trouvez une solution, vous pouvez l’ajouter à la documentation. Je comprends que c’est un effort supplémentaire, mais je ne crois pas qu’on va y arriver si c’est toujours les mêmes personnes qui contribuent à la documentation.
C’est compliqué.
Je ne pourrais mieux résumer. Et ça n’ira pas en se simplifiant malheureusement. Il y a un équilibre entre être une équipe avec des pratiques qui sont ——- et maintenir ——-. On fait tout notre possible pour que personne ne se sente laisser derrière.
En résumé : Formation sur Git, Formation sur l’extraction de données.
Montrer comment changer de RStudio local au serveur.
Git
R - Github (le concept de commit, push, pull semble en mélanger plus d’un)
Extraction des données. Fonctions de base R qui sont souvent utilisées ? (Metons subset et des trucs du genre ?) Comment créer une branche dans Git Hub et les bonnes pratiques qu’on aimerait mettre en place ? (Genre ——- m’a parlé de ——-, mais je suis pas mal certaine que personne connaît ça)
Moins SQL + extraction de données des ——-
Les packages (——-) pour accéder à la donnée de l’assurance dommages ——-. les packages offrent une certaine documentation à haut niveau mais elle n’est pas adéquate pour quelqu’un qui part de zéro :(
L’accès aux données (un tutoriel pour nouveau). Tout l’écosystème d’outil dans son ensemble avec l’utilité de chaque plate-forme/ outls.
Partir de zéro ce n’est certainement pas évident. Voir mon commentaire plus haut sur la documentation. Pour Git avec R, je recommande toujours Happy Git and GitHub for the useR.
Je trouve que les Readme des packages maison sont souvent abandonné. Je pense qu’on devrait mettre le peu d’effort pour enrichir la documentation. Je sais que ce n’est pas facile. Aussi, un formation où on apprend à mieux travailler, passer de ——- à une présentation par exemple en utilisant les packages maisons.
J’encourage tout le monde à contribuer à la documentation ou du moins, ouvrir une issue, communiquer sur ——- lorsque vous rencontrez une documentation spécifique manquante.
je sais qu’il y a plein de trucs en R j’utilise juste SAS et R si nécessaire
Peut être une formation très de base des outils pour gestionnaires serait nice ! Si on parle R avec un spécialiste R, je veux en savoir juste assez pour comprendre ce que fait l’outil.
C’est un langage qui permet de manipuler la donnée. C’est Excel sur la sauce selon moi.
Formation sur R
J’ai eu quelques questions sur le code R en tant que tel. On parle beaucoup de l’utilisation des VMs, de Github, etc, mais je crois qu’on oublie un peu la base, que beaucoup de users n’ont jamais vu une ligne de code R de leur vie. Genre “==” c’est égal, !=, <-, etc.
Bon point, je vous invite à consulter la documentation sur les opérateurs R. C’est disponible directement dans à partir de la console. Savoir comment accéder à la documentation en R est un gros plus.
?`==`
?`<-`
?`+`
Je viens de revenir ——-, et avant de partir j’entamais un virage de SAS vers R. Donc, des formations R serrais appropriées dans mon cas (bien que je connaisse la base). Aussi, Github est tout nouveau pour moi … à voir si c’est intuitif.
Bon retour.
Améliorer mon aisance
Mieux comprendre les interactions entre ——-, les API, plumber et les logs.
M’améliorer en R et être en mesure de bien répondre aux questions de mes collègues.
Créer encore plus d’outils et de formation. Surtout de la formation.
Supporter les membres de ma direction dans l’apprentissage de Github et Rstudio
Me familiariser encore plus avec tout ce qui est Git et VM (et aussi R en général). Je commence à comprendre la patente.
Améliorer la qualité et la simplicité du code que je produis
jaimerais bien ca mieux comprendre R. c’est pas la programmation en tant que tel qui me bloque, mais l’accès aux bases de données et me familiariser avec ce que vos outils font. Mes projets ne bénéficient pas vrmt des outils que vous développés ET jai pas le temps pour faire ca. 30 min par ci par là c pas assez pour me familiariser, il me faudrait 1 semaine
Transitionner de Pycharm vers VScode
Exploiter le plein potentiel de ce qui est déjà en place !
Pas trop d’objectif personnel en lien avec les outils car je ne les utilisent à peu près pas
Augmenter mes skills de programmation R
RStudio Workbench
Mieux comprendre les concepts d’environnement dans R, je suis toujours un peu mêlé là-dedans. Ça pourrait peut-être faire partie d’une formation plus avancée? Aussi mieux comprendre le processus de mise en prod de code (plumber, etc).
Augmenter mon utilisation de R.
Continuer de m’améliorer en R en dérangeant moins ——-.
Me familiariser/mettre à niveau avec les nouveaux outils utilisés par mon équipe
Améliorer mes skills en R
Apprendre à faire du R
M’initier aux autres outils que SAS ou Excel
Comprendre tous les outils et savoir qui fait quoi là-dedans.
Merci à tous de vous être prêtés à l’exercice.
Les données ont été recueillies directement à partir de Microsoft Forms.
(removed)
Excluant les outils de communications comme Microsoft Outlook, Microsoft Word, Microsoft Powerpoint, Microsoft Teams, Cisco Jabber et les navigateurs web↩︎